c++ - MBCS 到 UTF-8 C++

ruby 1.9 : Convert byte array to string with multibyte UTF-8 characters

我正试图在Ruby中找到一种方法来获取UTF-8字节数组并将其转换回字符串。在irb(Ruby1.9.2预览版3)中，我可以从UTF-8字符串创建正确的字节数组:ruby-1.9.2-preview3>'Café'.bytes.to_a=>[67,97,102,195,169]但是，我找不到从字节返回数组的方法。我尝试将Array.pack与U*选项一起使用，但这不适用于多字节字符。ruby-1.9.2-preview3>[67,97,102,195,169].pack('U*')=>"CafÃ©"有没有人知道如何将包含多字节字符的UTF-8字节数组转换回字符串？谢谢。

ruby-on-rails - 如何使用 OpenSSL::Cipher 加密 UTF-8 字符串中的数据？

在Rails3.0(Ruby1.9.2)应用程序中，我正在尝试使用如下方式加密一些数据:cipher=OpenSSL::Cipher.new'aes-256-cbc'cipher.encryptcipher.key=cipher.random_keycipher.iv=cipher.random_ivencrypted=cipher.update'mostsecretdataintheworld'encrypted这将进入UTF-8数据库。我的问题是>encrypted.encoding=>#>encrypted.encode'utf-8'Encoding::UndefinedConv

UTF-8 ruby-on-rails cipher section ruby openssl aes

ruby-on-rails - ruby 正则表达式错误 : incompatible encoding regexp match (ASCII-8BIT regexp with UTF-8 string)

我遇到了两个错误，都与编码有关并且都相关。我在启动WEBrick时遇到的第一个错误(技术上是警告):/Users/USERNAME/example/config/initializers/bb-ruby.rb:54:warning:invalidUnicodeProperty\P:/\:\-?\P/它所指的行是:/\:\-?\P/,这只是一些正则表达式，最终是这个block的一部分:@@tags['Razzing']=[/\:\-?\P/,'','Razzing',':P',:razzing]然后，我在解析一些字符串时也得到了以下错误(大概是由于同一行)...Encoding::Com

UTF-8 regexp code section ruby-on-rails ruby unicode encoding character-encoding

ruby-on-rails - Ruby 2.0.0 字符串#Match ArgumentError : invalid byte sequence in UTF-8

我经常看到这种情况，但还没有想出一个优雅的解决方案。如果用户输入包含无效的字节序列，我需要能够让它不引发异常。例如:#@raw_responsecomesfromuserandcontainsinvalidUTF-8#forexample:@raw_response="\xBF"regex.match(@raw_response)ArgumentError:invalidbytesequenceinUTF-8已经问了很多类似的问题，结果似乎是对字符串进行编码或强制编码。然而，这些都不适合我:regex.match(@raw_response.force_encoding("UTF-8"

UTF-8 ruby-on-rails code invalid ruby ruby-on-rails-4 ruby-2.0

ruby-on-rails - 在 Ruby on Rails 中， '#encoding: utf-8' 和 'config.encoding = "utf-8"' 是否不同？

我可以通过在其顶部添加注释行来指定任何ruby文件使用特定编码:#encoding:utf-8但是在Rails的config/application.rb中，我发现了这个:config.encoding="utf-8"它们有什么不同吗？如果我设置了config.encoding="utf-8"，我还需要#encoding:utf-8吗？最佳答案 config/application.rb中的config.encoding="utf-8"部分与Rails应如何解释内容有关。ruby文件中的#encoding:utf-8告诉rub

amp encoding code section ruby-on-rails ruby

ruby - 有没有办法从 UTF-8 编码的文件中删除 BOM？

有没有办法从UTF-8编码的文件中删除BOM？我知道我所有的JSON文件都是用UTF-8编码的，但是编辑JSON文件的数据录入人员将它保存为UTF-8和BOM。当我运行我的Ruby脚本来解析JSON时，它因错误而失败。我不想手动打开超过58个JSON文件并转换为没有BOM的UTF-8。最佳答案对于ruby>=1.9.2，您可以使用模式r:bom|utf-8这应该有效(我还没有结合json测试它):json=nil#definethevariableoutsidetheblocktokeepthedataFile.open('

UTF-8 ruby code section byte-order-mark

Ruby:如何自动添加 "# encoding: UTF-8"？

是否有任何gem可以自动将#encoding:UTF-8添加到每个Ruby文件？或者是否有任何其他方法可以防止整个RubyonRails项目(不仅在单个类中)出现invalidmultibytechar(US-ASCII)错误？最佳答案升级到Ruby2.0，因为它使UTF-8成为默认编码，从而消除了对魔术注释的需要。关于Ruby:如何自动添加"#encoding:UTF-8"？，我们在StackOverflow上找到一个类似的问题： https://st

amp encoding section code Ruby utf-8

ruby - 从 Ruby 中的字符串中删除非 UTF 字符？

如何从ruby字符串中删除非UTF8字符？我有一个字符串，其中包含例如“xC2”。我想从字符串中删除该字符，使其成为有效的UTF8。这个:text.gsub!(/\xC2/,'')返回错误:incompatibleencodingregexpmatch(ASCII-8BITregexpwithUTF-8string)我也在查看text.unpack('U*')和string.pack，但没有得到任何结果。最佳答案您可以为此使用编码。text.encode('UTF-8',:invalid=>:replace,:undef=>

ruby section code stackoverflow regex string

ruby - 我怎样才能避免在 Ruby 1.9 中的每个 UTF-8 文件的顶部放置神奇的编码注释？

我有一个Rails项目，里面有很多西里尔字符串。它在Ruby1.8上运行良好，但Ruby1.9假定源文件是US-ASCII编码的，除非您在源文件顶部提供#encoding:utf-8注释。此时文件不被视为US-ASCII。是否有更简单的方法告诉Ruby“此应用程序是UTF8编码的。请将所有和任何包含的源文件视为UTF8，除非另有声明”？更新:我写了“Howtoinserttheencoding:UTF-8directiveautomaticallyinRuby1.9files”，它会在需要时自动附加编码指令。最佳答案我觉得你可以

UTF-8 ruby code section encoding ruby-1.9

ruby `encode' : "\xC3"从 ASCII-8BIT 到 UTF-8 (Encoding::UndefinedConversionError)

tvdb中的汉尼拔剧集里有奇怪的角色。例如:Œuf于是ruby吐出:./manifesto.rb:19:in`encode':"\xC3"fromASCII-8BITtoUTF-8(Encoding::UndefinedConversionError)from./manifesto.rb:19:in`to_json'from./manifesto.rb:19:in`'第19行是:puts@tree.to_json有没有办法处理这些非utf字符？我宁愿不替换它们，而是转换它们？还是无视他们？我不知道，感谢任何帮助。奇怪的是脚本通过cron运行良好。手动运行它会产生错误。

UTF-8 amp section code ruby encoding